可預測性的研究通常依賴於有關市場回報可預測性的預測變量。
例如:股息收益率、名義收益率和收益率利差。
當特定行業出現現金流不穩定時,訊息處理的限制會阻礙專門從事相關行業的投資者快速了解市場。
由此導致的股票價格的延遲調整,導致基於滯後行業回報的可預測性。
預測回歸模型中存在過多的潛在預測變量,傳統的普通 OLS 估計有潛在的缺點。
如果使用所有滯後回報,大量的預測變量會使 OLS 估計容易出現過度擬合。
如果只選擇少數滯後回報,則很難先驗地知道哪些是最重要的。
採用最小絕對收縮和選擇運算子(least absolute shrinkage and selection operator, Lasso)方法可以防止高維設置中的資料過度擬合,並選擇最相關的預測變量。
LASSO 依賴於 L1 懲罰項,因此它允許某些權重收縮到恰好為零。
因此,它執行變量選擇,這通常會產生稀疏模型,減輕了資料的過度擬合。
稀疏性有兩個關鍵優勢:
使用 LASSO 來降低模型的維度;為了減少 LASSO 權重估計中的偏差,使用 OLS 重新估計所選預測變量的權重。